查看原文
其他

USEARCH11发布,新功能简介

宏基因组 宏基因组 2022-03-28

USEARCH是继Mothur、QIIME后的第三大流行扩增子分析流程,目前引用7296次。由Robert Edgar大神独立编写。官方网址:http://www.drive5.com/usearch/

详细介绍,请参阅

软件优缺点

  • 优点

跨平台
体积小巧
易用

  • 缺点

软件64位版收费
代码不开源

v11新功能

就在2018年7月末,USEARCH(Ultra-fast sequence analysis)扩增子分析神器迎来了其第11个大版本,

具体有哪些新功能呢?

详见此页:

http://www.drive5.com/usearch/manual/whatsnewv11.html

主要新增了6大新功能,21个新命令,下面进行简介。

新特征

  • 机器学习:主要包括随机森林、多次交叉验证、OTU分类重要性,包括的命令有森林训练、森林分类和森林交叉验证

  • 改进嵌合体检测

  • 新增了两种Alpha多样性指数: Mirror estimator、 Singleton-free (FE) estimator

  • Octave plot(八度图)展示Alpha多样性,方便观察样本品中真实序列、测序错误和嵌合体数量

  • 样品组间多样性比较

  • 同一性交驻验证特征预测的准确率

新命令

  1. calc_lcr_probs: Calculate lowest common rank probabilities 计算序列物种分类各级概率

  2. cluster_tree: Construct clusters from tree using distance cutoff 基于树文件聚类

  3. distmx_split_identity: Split distance matrix into test/training pair for CVI 拆分距离矩阵为测试和训练集

  4. fastx_syncpairs: Sort forward and reverse reads into the same order 双端序列找成队并排序

  5. fastx_trim_primer: Remove primer-binding sequence from FASTx file 引物匹配并切除

  6. forest_classify: Classify data using random forest 随机森林分类预测

  7. forest_train: Train random forest classifier 随机森林分类器建立

  8. nbc_tax: Predict taxonomy using RDP Naive Bayesian Classifier algorithm 采用RDP算法预测分类学物种注释

  9. otutab_binary: Convert OTU table with counts to presence(1) / absence(0) 转换OTU表为二元(有、无)形式

  10. otutab_forest_classify: Classify samples using random forest 样品随机森林分类

  11. otutab_core: Identify core microbiome in OTU table 鉴定OTU表中核心微生物组

  12. otutab_forest_train: Train random forest classifier on OTU table 基于OTU表的随机森林训练

  13. otutab_otus: Extract OTU labels from OTU table 提取OTU表中的OTUs

  14. otutab_rare: Sub-sample OTU table to same number of reads per sample 抽样标准化OTU表

  15. otutab_samples: Extract sample labels from OTU table 提取OTUs表中样品名

  16. otutab_select: Identify OTUs which are informative (correlate with metadata) 鉴定更有信息的OTUs,,即组间差异OTUs

  17. otutab_xtalk: Identify cross-talk using improved algorithm (UNCROSS2) 改进算法鉴定嵌合

  18. search_pcr2: In-silico PCR, search for matches to primer pair 电子PCR,基于引物匹配扩增区

  19. subtree: Extracts subtree under given node 提取树中指定结点的子树

  20. tabbed2otutab: Convert read mapping file (read+OTU) to OTU table 单行表格转换为OTU表

  21. tree_subset: Extract subset of tree for given set of leaf labels 根据树叶标签提取子集

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外1800+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存